home *** CD-ROM | disk | FTP | other *** search
/ Software Vault: The Diamond Collection / The Diamond Collection (Software Vault)(Digital Impact).ISO / cdr13 / htmlco17.zip / HTMLCON.TXT < prev   
Text File  |  1995-03-24  |  11KB  |  265 lines

  1.  
  2.                 HTMLCon Version 1.7 (April, 1995)
  3.                An HTM(L) to ASCii Document Converter
  4.  
  5.  
  6.                        Satore Township
  7.                        P.O. Box 750836
  8.                    Petaluma, CA 94975-0836
  9.  
  10.  WWW to ftp://ftp.crl.com/ftp/users/ro/mikekell/html/satore.htm
  11.          FTP to ftp.crl.com/ftp/users/ro/mikekell/ftp
  12.  
  13.       This program may be distributed freely as long as no
  14.       modifications are made to it or this documentation.  We
  15.       ask that you register this program if you find it useful.
  16.       The registration fee of $7.00 (U.S., by check) should be
  17.       mailed to Satore Township at the address given above. If
  18.       you register this program and provide us with your e-mail
  19.       address, we will provide you with the command to eliminate
  20.       the registration request screen which appears when the
  21.       program is initiated.
  22.  
  23.       E-mail to mikekell@crl.com for comments or suggestions.
  24.  
  25.  
  26.                        About the Program
  27.                        -----------------
  28.  
  29. HTMLCon converts HTML (extension .HTM) documents to standard ASCII
  30. (extension .ASC) files for viewing or printing.  HTMLCon operates
  31. under MSDOS or under any program capable of providing an MSDOS session
  32. and using COMMAND.COM as a command interpreter.  After processing the
  33. input document (.HTM), output will be displayed on a viewer or editor
  34. of your choice as defined in the control file (see below).
  35.  
  36. HTMLCon recognizes HTML symbology through HTML+ level as of this date.
  37. It will automatically detect HTML files created in either an MSDOS or
  38. UNIX environment and process them correctly.  HTMLCon will attempt to
  39. process the raw HTML file such that the output is as readable as
  40. possible, eliminating unfavorable formatting to every extent practical.
  41. Output may then be viewed, edited or printed as desired.
  42.  
  43.  
  44.                    What's New in Version 1.4
  45.                    -------------------------
  46.  
  47. This version allows the user to specify "find" and "replace" strings
  48. to modify ouput from the HTM file to the ASCii file.  The user may
  49. define up to 50 such strings, each with a length of up to 40 characters.
  50. "FIND" strings in the HTM file will be converted to "REPLACE" strings
  51. in the output file.  These find/replace components only take place after
  52. HTMLCon has done its primary conversion and therefore allow the user to
  53. make further refinements to the final output document.
  54.  
  55.  
  56.                   What's New in Version 1.6
  57.                   -------------------------
  58.  
  59. Three new structures in the INI file have been added:
  60.  
  61. keepformatting=yes, will preserve the general structure of the original
  62. HTML file and will not attempt any formatting whatsoever.  The intent of
  63. this option is to allow users to strip only HTML constructs while
  64. preserving the author's original formatting (for better or worse).
  65.  
  66. ignoresymbols=yes, will tell HTMLCon not to insert it's own symbols in
  67. the place of certain HTML constructs.  This works in conjunction with
  68. the "keepformatting=yes" option above to preserve as much of the
  69. original HTML construction as possible while still eliminating
  70. unnecessary HTML constructs.
  71.  
  72. keephref=yes, will preserve all <A HREF, <A NAME, etc. constructs
  73. when converting the HTML file.
  74.  
  75. Effective with version 1.53 two additional modifications have been made:
  76.  
  77. 1.  The user may specify any input file name, with any file extension.
  78. If no file extension is specified, HTMLCon will assume the extension
  79. ".HTM" is indicated.
  80.  
  81. 2.  The intermediate file (WORKING.HTM) is now deleted after HTMLCon
  82. completes processing.
  83.  
  84. Effective with version 1.54 the following enhancements have been made:
  85.  
  86. 1.  HTMLCon now allows users to specify output filenames on the command
  87. line or in the interactive mode.  If an output filename is not
  88. specified, it will default to the base filename of the input file plus
  89. the extension ".ASC".
  90.  
  91. 2.  It is possible to use two forms of command line arguments:
  92.  
  93.     A. HTMLCon input_filename line_length output_filename, or
  94.     B. HTMLCon input_filename output_filename.
  95.  
  96. If option "B" above is used, the default line_length from the
  97. HTMLCon.INI file will be used or, if not stated, the program default
  98. line_length of 65 characters.
  99.  
  100. In addition, a number of bug fixes were included (such as proper
  101. interpretation of <META and <!-- constructs, and others).
  102.  
  103. See the HTMLCon control file below for details.
  104.  
  105. A new command line option has been added to support these two new INI
  106. commands.  If you invoke HTMLCon as "HTMLCon HTML_filename CLEAN",
  107. HTMLCon will assume both "keepformatting=yes" and "ignoresymbols=yes"
  108. for the file in use, regardless of these statements in the INI file.
  109.  
  110.  
  111.                   What's New in Version 1.7
  112.                   -------------------------
  113.  
  114. HTMLCon now has the ability to process multiple input files.  When used
  115. in this mode HTMLCon will automatically assign the file extension '.ASC'
  116. to all outputfiles.  HTMLCon will automatically detect the multiple file
  117. input mode by the presence of a '*' or '?' in the input file name.
  118.  
  119. For example, suppose that HTMLCon resides in the directory "C:\HTMLCON"
  120. and that there are several HTM/HTML files in the directory "C:\HTMLWRIT"
  121. that you wish to process.  First, move to the "C:\HTMLCON" directory,
  122. then issue the command "HTMLCON C:\HTMLWRIT\*.HTM".  HTMLCon will
  123. process the files, one-by-one, asking you each time if you wish to
  124. proceed with processing the next file.  When asked if you wish to
  125. proceed, you will be given the following options: Y)es (the default), N)o
  126. (no to this file only), Q)uit (quit processing all files), or A)ll
  127. (process all of the remaining files without pausing).
  128.  
  129. In addition, while in the multiple file mode, HTMLCon will create a
  130. batch file (HTMLCONM.BAT) in the default directory.  This batch file may
  131. be run by the user to again process the same multiple files indicated on
  132. the command line or in reponse to the input file name prompt given by
  133. HTMLCon.
  134.  
  135.                           Installation
  136.                           ------------
  137.  
  138. Copy HTMLCON.EXE and HTMLCON.INI to a new directory of your choice.
  139. The program is now ready to run.  Source files (.HTM) should be
  140. placed in this directory for processing.  Outputfiles (.ASC) will
  141. be created in this directory.
  142.  
  143.  
  144.                             Operation
  145.                             ---------
  146.  
  147. HTMLCon can be operated in the interactive mode by running "HTMLCon"
  148. from the MSDOS session.  It can also be run without operator
  149. intervention by using the following command line arguments:
  150.  
  151. HTMLCon input_file[.HTM] line_length output_file[.ASC], or
  152. HTMLCon input_file[.HTM] output_file[.ASC]
  153.  
  154. where "line_length" indicates where HTMLCon should try to break a line
  155. for the output file, using values between 40 and 200 characters per
  156. line.  Preferences can be stated in HTMLCON.INI as shown below.  The
  157. default file extensions can be overridden on the command line for both
  158. input and output files.
  159.  
  160. Images found in the HTM file are output as [IMAGE], HREF references as
  161. [*].  Forms are properly noted and marked, as is preformatted text and
  162. other special HTML symbols.  Derivatives are ignored except when the
  163. text is preformatted.
  164.  
  165. Since the HTM Language is evolving continuously, it is possible that
  166. HTMLCon may not recognize certain symbols properly.  Also, since there
  167. is great variation in the creation of HTML documents, it may not be
  168. possible to ideally format all output.  Problems with the output will be
  169. corrected in future versions and we ask that you let us know of any
  170. problems by sending us e-mail, including the original HTML document that
  171. is not being processed correctly.
  172.  
  173.  
  174.                        HTMLCon Control File
  175.                        --------------------
  176.  
  177. The control file should be named HTMLCON.INI and exist in the same
  178. directory as HTMLCon.  Here is a sample, with explanations, of the
  179. control file:
  180.  
  181. # HTMLCon Initialization File (current through version 1.5x)
  182. #
  183. # Lines beginning with a pound sign are considered comments.
  184. # All other lines are considered instructions and must exactly follow
  185. # the format described in this sample file.  Arguments are seperated
  186. # by an equal sign (=) which must not be preceeded or succeeded by
  187. # a space or tab.
  188. #
  189. # Define the default point at which HTMLCon should attempt to break a
  190. # line for the output file.  The break is not guaranteed to occur at
  191. # this point, but as close to it as possible to retain the syntax of
  192. # the input line.  Default=65.
  193. #
  194. linebreak=70
  195. #
  196. # Statistics can be compiled and written to the output file.  Default=No.
  197. # statistics=no
  198. #
  199. statistics=yes
  200. #
  201. # You may launch another program after HTMLCon finishes its work.  This
  202. # may be an ASCII file viewer, editor, or whatever.  The launched program
  203. # must be able to take the output file name as an argument.  In order to
  204. # accomplish this you must provide the FULL PATH to your program.
  205. #
  206. launchprog=c:\utils\list.com
  207. #
  208. # Find and replace:  you may specify up to 50 strings to be located in
  209. # the HTM file and replaced in the ASCII output file.  These will be a
  210. # direct replacement using the two commands "find=" and "replace=".  Each
  211. # "find" element will be replaced by a "replace" element, therefore you
  212. # cannot have a "find=" statement without a following "replace=" statement.
  213. # To specify leading or ending spaces in a statement, surround the statement
  214. # with quotations (").  The strings cannot exceed 40 characters each.
  215. #
  216. find=" -- "
  217. replace=--
  218. #
  219. # Here is an example replacing all reference symbols [*] with just *.
  220. #find=[*]
  221. #replace=*
  222. #
  223. # And replace all image symbols [IMAGE] with a shorter one.
  224. #find=[IMAGE]
  225. #replace=[I]
  226. #
  227. # And replace all HTMLCon list/tab markers with three spaces.
  228. find=->
  229. replace="   "
  230. #
  231. #
  232. # You may elect to keep the formatting characteristics of the original
  233. # HTML file intact.  This will preserve white spaces, line breaks, etc. as
  234. # originally constructed by the author of the HTML page.  This option
  235. # will also eliminate the HTMLCon tab markers (->) and replace them with
  236. # four spaces to indicate tab lists. Uncomment the following line to
  237. # preserve the original formatting:
  238. #
  239. # keepformatting=yes
  240. #
  241. #
  242. # You may choose to have HTMLCon not replace certain HTML constructs
  243. # with its own markers (for example, HTMLCon replaces image references
  244. # with the symbol [*]).  To have HTMLCon simply ignore its own symbols and
  245. # not reference certain items in the original HTML file, uncomment the
  246. # next line:
  247. #
  248. # ignoresymbols=yes
  249. #
  250. # You may instruct HTMLCon to preserve all <A HREF...> constructs when
  251. # converting the HTML file.  These references will be preserved intact,
  252. # without modification.  To use this feature, uncomment the next line:
  253. #
  254. # keephref=yes
  255. #
  256. #
  257. # Eliminate the advertisements and delays
  258. # [available to registered users only]
  259. #
  260. #
  261. # End of file
  262.  
  263.  
  264.  
  265.